Trabajo Práctico Nº2 - Análisis Exploratorio de Datos
Introducción
Se cuenta con la base de datos de un sitio web de compras online (shop.merch.google), con el fin de encontrar distintas relaciones entre las variables provistas, se procede a hacer un análisis descriptivo de las visitas al sitio web para responder distintas interrogantes.
La base de datos original contiene variables clave como:
- ID: número que identifica a cada visitante del sitio web.
- fecha: fecha de la visita al sitio web.
- clicks: cantidad de clicks realizados durante la visita al sitio web.
- paginas: cantidad de páginas accedidas durante la visita al sitio web.
- tiempo: duración de la visita al sitio web, en segundos.
- gasto: valor monetario de las compras realizadas durante la visita al sitio web, en dólares.
- browser: tipo de navegador desde el que accedió al sitio web.
- dispositivo: tipo de dispositivo desde el que accedió al sitio web.
- pais: país de residencia del visitante del sitio web.
¿La distribución geográfica de las visitas refleja una concentración marcada en determinado país?
El mapa muestra la distribución geográfica del total de visitas al sitio web durante el período analizado (Enero-Junio de 2017). Se observa una marcada concentración en Estados Unidos (EE. UU), país que registra un volumen de accesos significativamente superior al resto del mundo.
Estados Unidos alcanza un total de 172,200 visitas registradas, siendo más de 6 veces el número de visitas del segundo país más relevante, India, que cuenta con 24,359 visitas. Esta concentración podría ocasionar una fuerte dependencia comercial con el mercado estadounidense.
Debido a esto, se recomienda una expansión a nivel internacional de la página web para que, de esta manera, se amplíe la base de clientes potenciales.
¿Cómo se distribuyó el gasto total semanalmente, y qué diferencia se observa entre el gasto de Estados Unidos y el del resto de países?
La línea temporal muestra la evolución semanal del gasto total en el sitio web, diferenciando a Estados Unidos (EE. UU.) del resto de los países.
Se puede observar que el gasto realizado en Estados Unidos es ampliamente superior en el periodo de tiempo analizado, además de presentar picos mucho más marcados en la temporada Abril-Mayo de 2017.
El gasto total del resto de países (sin considerar a Estados Unidos) a lo largo del periodo analizado presenta picos que se encuentran distribuidos uniformemente a lo largo de los meses, sin ninguna concentración en algún mes en particular.
¿La cantidad de visitas donde se efectuo una compra esta relacionado con el gasto promedio por usuario?
El gráfico describe la relación entre el número de visitas efectivas (donde se efectuó una compra) y el gasto promedio por usuario. Se puede observar la presencia de dos usuarios con valores atípicos (outliers) que se alejan del comportamiento de la mayoría, por lo cual se procede a visualizar el grupo de usuarios sin estos datos atípicos.
En el gráfico podemos observar que la tendencia en el gasto promedio por visita de los usuarios disminuye a medida que aumenta el número de visitas efectivas (compras).
Podemos destacar que:
Los usuarios con compras únicas (1 visita efectiva) tienen la mayor dispersión en su gasto promedio, alcanzando los valores más altos (7000 USD).
Los usuarios con más visitas efectivas (mayor frecuencia de compra) tienden a concentrar la variabilidad del gasto promedio en un rango mucho menor (alrededor de 1,000 USD o menos).